大咖 | Chris Wendt:你还在为机器翻译犹豫不决吗?不妨看看微软怎么做
【编者按】日前,以“‘一带一路’:语言服务的机遇和挑战”为主题的第四届京交会语言服务推介洽谈会在北京国家会议中心举办。
微软翻译总经理Chris Wendt在第四届京交会语言服务推介洽谈会上发表主题演讲,介绍了机器翻译的发展现状、趋势和前景,并现身说法介绍了微软翻译的运作经验,他认为,机器翻译现在还只是个开始。
本文为“大咖讲堂”第十一篇。译世界将推出大咖们的精彩发言内容,请持续关注。
本文根据Chris Wendt的讲话实录整理:
机器翻译已经有60年的发展历史,最早是由军方和情报部门资助,现在主要用于商业。接下来我介绍一下机器翻译的现状以及未来的发展趋势。对于不同的语言组合,翻译的质量可能有很大不同。不论是什么语言,机器翻译的质量都是低于人工翻译质量的。但是,机器翻译在很多场景下都是有益的,大多数时候,用户也会选择机器翻译。
现状:现在每天机器翻译量超2000亿词,若人工大概需1亿个译员
首先是算法,我们称之为“解码器”。最早的机器翻译主要基于规则,现在主要基于统计和神经学研究。
其次,源语的质量和领域的相关性也是至关重要的。对于句式结构相似,以及有很多平行文本的语言,机器翻译的质量相对较高。对于英语和西语的互译,机器翻译的使用频率很高,特别有用。但是,对于中英互译来说,通常机器翻译的结果很难让人理解,译文和源语并不能一一对应。同时,源语质量也极大影响着翻译结果,比如使用微软去翻译“我爱你”,其结果会让人非常满意;而对于书写不规范或者有其它问题的源语,翻译的结果可能就不会令人满意。
虽然如此,机器翻译被接受的程度在过去10年有显著提升。现在机器翻译的数量增长迅猛,每天的翻译量超过2000亿词,远超过人工翻译。这些机器的翻译量如果让人工去做,大概需要1亿位译员,而现在全球的译员数量远远不能满足这个要求。
机器翻译主要应用于网络内容的翻译,包括数据挖掘、分析、提取要点、分类等等。还有一部分用途是发布其它语言的文本,这样可以减少人工成本,也能够提高信息的发布速度。出版商可以将机器翻译的成果商业化,也可以进一步优化商业成果。
微软翻译是怎么做到兼顾“质量”、“速度”和“价格 50 29461 50 14942 0 0 3284 0 0:00:08 0:00:04 0:00:04 3284 50 29461 50 14942 0 0 2682 0 0:00:10 0:00:05 0:00:05 2959”三者的
使用微软翻译的用户,翻译质量得到显著提高,译后编辑发挥了不可替代的作用。译后编辑是经过机器翻译以后由人工校正机器翻译的文本,以提高机器翻译的质量。
微软知识库是通过机器翻译发布信息的最大应用之一。我们用33种语言已发布了20多万篇文章,其中,5%的文章由人工翻译,95%由机器翻译。鉴于用户可能对源语有一定了解,用户只需要反转页面就可以看到通过机器翻译的源语,这对于语言学习者大有裨益。用户也可以提供反馈或者进行校正,由专业人士决定是否采纳。如果接受用户的反馈意见和校正,反馈的结果就会显示在页面上,所有人都可以看到。
如何确保这样做的结果跟预期是相符的呢?当然,我们需要征求用户的意见,以评估这种做法是否成功。
我们经常说在质量、速度和价格三者之间,只能兼顾其中两项。但是,通过译后编辑,这三者可以兼得。
首先是发布文章或信息,使用已有的经过人工翻译的记忆库。通过人工译员改善翻译质量,然后继续发布信息。我们可以针对商业信息采取措施,不断更新文本,进一步更新标准。这样做能够提高本地化水平,同时也能够提高文本翻译的效率,使翻译工作的数量超乎想象。
译后编辑可以改善译文的质量,也能够提高译员的效率。如果不经过处理就发布信息,虽然保证了速度,但译文质量很低。如果我们在发布以后进行译后编辑,这两者都能够兼得,我们能够利用各方力量来改善译文的质量。
机器翻译对用户非常有用,但一些企业仍犹豫不决
对于人类来说,我们一直以来的梦想就是可以跟那些不同语言的人进行自然交流,而不需要借助其他人的帮助。为什么我们现在要发展机器口译呢?其实是有几种因素在发挥作用,能够让我们使用机器口译,帮助我们进行人际交流。
机器翻译在不断取得进步,虽然进步的速度相对缓慢。在过去几年,由于神经学研究的进步,语音识别技术得到了很大发展,出错率有所降低,翻译质量相对提高。微软有一个很好的技术,能够把机器翻译技术应用于Skype上。
Skype融合了微软翻译、用户界面、机器翻译等技术,不仅可以为对话的双方提供实时语音翻译,还可以通过在界面显示的翻译文本,帮助那些失聪或有语言障碍的人。
语音翻译面临的困难在于不能很好地识别语气词,所以我们需要对语音识别的结果进行处理,去除一些不连贯的内容,使其便于理解。对于同一种语言,去除不连贯的内容可以帮助改善译文质量。
对于机器翻译来说,未来的走向只有不断向前。由于神经网络的引进,机器翻译的质量和技术将会有很大飞跃。在未来几年,机器文本翻译的质量会有所改善,而且会越来越普及。
对于机器翻译来说,现在还只是个开始。机器翻译对用户来说非常有用,但一些企业仍然犹豫不决。
您对翻译行业的见地,欢迎与我们分享交流。来稿请致:media@yeeworld.com。